Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
نویسندگان
چکیده
Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme cadre de travail afin de formaliser et de combiner plusieurs hypothèses sur les usages terminologiques et enfin de structurer le lexique sous la forme d’une taxonomie. Nous considérons également le problème de l’évaluation des taxonomies résultantes et proposons un nouvel indice afin de les comparer et de positionner notre approche par rapport à la littérature.
منابع مشابه
Acquisition de structures lexico-sémantiques à partir de textes : un nouveau cadre de travail fondé sur une structuration prétopologique
Résumé. Les structures lexico-sémantiques jouent un rôle essentiel dans les processus de fouille de textes. En codant les relations sémantiques entre concepts du discours elles apportent une connaissance stratégiques pour enrichir les capacités de raisonnement. Le développement de telles structures étant fortement limité du fait des efforts nécessaires à leur construction, nous proposons un nou...
متن کاملApproche générique pour l'extraction de relations à partir de textes
Résumé : Cet article s’intéresse à l’extraction de relations dans le contexte du web sémantique, en vue de procéder à de la construction d’ontologies aussi bien qu’à de l’annotation automatique de documents. Notre approche permet l’extraction de relations entre entités à partir de textes. Elle ne fait pas d’hypothèse sur les entités, de manière à la rendre aussi générique que possible, et à aut...
متن کاملClassification Automatique Non supervisée de Documents Textuels basés sur Wordnet
Mettre en œuvre l’une des méthodes de classification non supervisée consiste en premier lieu à choisir une manière de représenter les documents (Sebastiani, 2002) ; dans un second temps il faut choisir une mesure de similarité, et en dernier lieu choisir un algorithme de classification que l'on va mettre au point à partir des descripteurs et de la métrique choisis. Tout document dj sera transfo...
متن کاملExtraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)
Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...
متن کاملDaFOE : une plateforme pour construire des ontologies à partir de textes et de thésaurus
Depuis son émergence, au début des années 1990, dans les recherches en modélisation de connaissances, la notion d’ontologie s’est rapidement diffusée dans un grand nombre de domaines de recherche en informatique. Compte tenu du caractère très prometteur de cette notion, de nombreux travaux ont visé à permettre son utilisation dans des domaines aussi divers que le traitement automatique de la la...
متن کامل